在使用深神经网络的现有图像分类系统中,图像分类所需的知识隐含在模型参数中。如果用户想更新此知识,则需要微调模型参数。此外,用户无法验证推理结果的有效性或评估知识对结果的贡献。在本文中,我们研究了一个存储图像分类知识的系统,例如图像特征图,标签和原始图像,而不是模型参数,而是在外部高容量存储中。我们的系统在对输入图像进行分类时,像数据库一样引用存储。为了增加知识,我们的系统会更新数据库,而不是微调模型参数,从而避免了在增量学习方案中灾难性的遗忘。我们重新访问一个KNN(K-Nearest邻居)分类器,并在我们的系统中使用它。通过分析KNN算法引用的邻域样本,我们可以解释过去如何将知识用于推理结果。我们的系统在ImageNet数据集上实现了79.8%的TOP-1精度,而在预处理后无需微调模型参数,而在任务增量学习设置中,在Split CIFAR-100数据集中获得了90.8%的精度。
translated by 谷歌翻译
最近,检测变压器(DETR)是一种端到端对象检测管道,已达到有希望的性能。但是,它需要大规模标记的数据,并遭受域移位,尤其是当目标域中没有标记的数据时。为了解决这个问题,我们根据平均教师框架MTTRANS提出了一个端到端的跨域检测变压器,该变压器可以通过伪标签充分利用对象检测训练中未标记的目标域数据和在域之间的传输知识中的传输知识。我们进一步提出了综合的多级特征对齐方式,以改善由平均教师框架生成的伪标签,利用跨尺度的自我注意事项机制在可变形的DETR中。图像和对象特征在本地,全局和实例级别与基于域查询的特征对齐(DQFA),基于BI级的基于图形的原型对齐(BGPA)和Wine-Wise图像特征对齐(TIFA)对齐。另一方面,未标记的目标域数据伪标记,可用于平均教师框架的对象检测训练,可以导致更好的特征提取和对齐。因此,可以根据变压器的架构对迭代和相互优化的平均教师框架和全面的多层次特征对齐。广泛的实验表明,我们提出的方法在三个领域适应方案中实现了最先进的性能,尤其是SIM10K到CityScapes方案的结果,从52.6地图提高到57.9地图。代码将发布。
translated by 谷歌翻译
神经网络和相关的深度学习方法目前处于用于分类对象的技术的前沿。但是,他们通常需要大量的时间和模型培训数据。他们学到的模型有时很难解释。在本文中,我们推进了FastMAPSVM(用于对复杂对象进行分类的可解释的机器学习框架),这是用于通用分类任务的神经网络的有利替代方法。 FastMAPSVM通过组合FastMap和SVM的互补强度,将支持矢量机(SVM)(SVM)的适用性扩展到具有复杂对象的域。 FastMap是一种有效的线性时间算法,该算法将复杂的对象映射到欧几里得空间中的指向,同时保留它们之间的成对域特异性距离。我们证明了FastMAPSVM在分类地震图的背景下的效率和有效性。我们表明,就精确,回忆和准确性而言,其性能与其他最先进的方法相当。但是,与其他方法相比,FastMAPSVM对模型培训的时间和数据量明显较小。它还提供了对象及其之间的分类边界的明显可视化。我们希望FastMAPSVM可行对于许多其他实际域中的分类任务。
translated by 谷歌翻译
近年来,使用人工智能创造了广泛的投资模式。人工智能自动交易可以扩大交易方式的范围,例如通过授权每天24小时运行的能力以及以高频交易的能力。如果可以充分考虑过去的数据,也可以预期自动交易比使用更多信息交易。在本文中,我们提出了一种基于深度加强学习模型的投资代理,这是一个人工智能模型。该模型考虑了实际交易中涉及的交易成本,并在很长一段时间内创建交易的框架,以便它可以在单一贸易上进行大量利润。在这样做时,它可以最大限度地提高利润,同时保持交易成本低。此外,考虑到实际操作,我们使用在线学习,以便系统可以通过不断更新最新的在线数据而不是使用静态数据来继续学习。这使得可以通过始终纳入当前的市场趋势信息来贸易非静止金融市场。
translated by 谷歌翻译
近年来,在许多工业领域引入了机器学习和AI。在诸如金融,医学和自主驾驶的领域,其中模型的推理结果可能具有严重后果,需要高的可解释性以及预测准确性。在这项研究中,我们提出了CGA2M +,其基于广义添加剂2模型(GA2M),并以两种主要方式不同。首先是单调性引入。基于分析师的知识基于某些功能对某些功能进行体重,而且预计不仅可以改善可解释性,而且还改善了概括性表现。第二个是引入高阶项:鉴于Ga2m仅考虑二阶交互,我们旨在通过引入可以捕获更高阶交互的更高阶项来平衡解释性和预测准确性。通过这种方式,我们可以通过应用学习创新来改善预测性能而不会影响可解释性。数值实验表明,该模型具有高预测性能和可解释性。此外,我们证实通过引入单调性来改善泛化性能。
translated by 谷歌翻译
概率分布之间的差异措施,通常被称为统计距离,在概率理论,统计和机器学习中普遍存在。为了在估计这些距离的距离时,对维度的诅咒,最近的工作已经提出了通过带有高斯内核的卷积在测量的分布中平滑局部不规则性。通过该框架的可扩展性至高维度,我们研究了高斯平滑$ P $ -wassersein距离$ \ mathsf {w} _p ^ {(\ sigma)} $的结构和统计行为,用于任意$ p \ GEQ 1 $。在建立$ \ mathsf {w} _p ^ {(\ sigma)} $的基本度量和拓扑属性之后,我们探索$ \ mathsf {w} _p ^ {(\ sigma)}(\ hat {\ mu} _n,\ mu)$,其中$ \ hat {\ mu} _n $是$ n $独立观察的实证分布$ \ mu $。我们证明$ \ mathsf {w} _p ^ {(\ sigma)} $享受$ n ^ { - 1/2} $的参数经验融合速率,这对比$ n ^ { - 1 / d} $率对于未平滑的$ \ mathsf {w} _p $ why $ d \ geq 3 $。我们的证明依赖于控制$ \ mathsf {w} _p ^ {(\ sigma)} $ by $ p $ th-sting spoollow sobolev restion $ \ mathsf {d} _p ^ {(\ sigma)} $并导出限制$ \ sqrt {n} \,\ mathsf {d} _p ^ {(\ sigma)}(\ hat {\ mu} _n,\ mu)$,适用于所有尺寸$ d $。作为应用程序,我们提供了使用$ \ mathsf {w} _p ^ {(\ sigma)} $的两个样本测试和最小距离估计的渐近保证,使用$ p = 2 $的实验使用$ \ mathsf {d} _2 ^ {(\ sigma)} $。
translated by 谷歌翻译